图像挖掘焕发商业新生命_新兴技术

随着大数据时代的来临，图像和视频数据呈爆发性增长，若同时处理亿级别、几十亿级别的图像视频数据是一个巨大的难题，因此深度学习技术一直面临着性能的挑战。

随着多媒体设备与技术的迅速发展，个人手机、监控摄像头、医学影像、卫星图像等在许多领域大量产生，越来越多的图像和影像被更容易、快速、廉价地获取和存储。如何从这些图像中分析并发掘出有价值的信息，并形成有用的知识成为了图像挖掘技术的研究重点。

图像挖掘（Image Mining）技术是指从图像数据库中抽取潜在的、有用的知识并关系图像数据的过程，是计算机视觉、图像处理、图像检索、数据挖掘、模式识别和人工智能等多学科交叉的研究领域。目前该技术在一些垂直领域的技术应用比较成熟，如人脸检测、平面物体如海报图书的图像检索、印刷体书籍文字识别等，其他方向都还依赖于持续研发和建设。

张小飞.jpg

一、图像挖掘技术浅谈

图像挖掘过程通常如下：首先通过传感器获得数据，然后进行预处理、特征提取、特征选择，最后做出推理、预测或识别。其中第二部分概括起来就是特征的表达，良好的特征表达能对最终算法的准确性起到关键的作用。以前，样本特征的抽取往往依靠人工经验，模型主要是负责分类和预测。在模型运用正确的前提下，特征的好坏就成了系统性能的瓶颈。

SIFT（Scale—invariant feature transform）算法。该算法是一种检测局部特征的算法，由David Lowe在1999年提出，并于2004年完善总结。作为特征提取的经典算法，许多科学家都对SIFT算法进行了研究改进，产生了一系列变种。SIFT算法主要特性在于尺度的不变性，即使改变图像旋转角度、缩放、明亮度或是拍摄视角，该算法仍然能取得较好的检测效果。

HoG（Histogram of Oriented Gradient）算法。该算法由Navneet Dalal和Bill Triggs于2005年提出，主要用于静态图像和视频的行人检测，以及静态图像中的车辆和常见动物的检测，该方法计算局部图梯度方向信息的统计值。与SIFT相比，HoG没有旋转和尺度不变性，且计算量较小。

二、深度学习焕发挖掘新生命

传统图像技术，一直以来依赖于专家特征和各种浅层模型的学习，现已进入瓶颈期，难以实现实用化。随着认知神经科学、生物学等学科的发展，科学家对人脑视觉系统有了深入的认识，这方面的研究也给人工智能的发展带来推波助澜的作用。

科学家研究发现，人类视觉系统的信息处理是分层的。视网膜获得光信号后，人脑从低级的V1区提取边缘特征，再到V2区的形状，最后到高层对整体目标物体的识别。高层特征是低层特征的组合，从低层到高层特征的表示变得抽象，更偏向含义或意图。

在此基础上，模拟人脑工作模式的深层神经网络（DNN，Deep Neural Networks）或深度学习（Deep Learning）被提出。一个图像可以由最基本的“边缘”（Edge）构成，边缘的组合形成“对象部分”（Object Parts），往上组合形成“对象模型”（Object Model）——这一点类似于文本的结构。最基本的笔画类似图片中的像素，往上形成文字、词语、段落、主题，从而被人们理解和学习。

深度学习的实质是模拟人脑神经的层次结构，构建多层机器学习模型和使用海量的训练数据，由上向下逐级地进行信息特征抽取，最终让机器“自主”地学习适合模式分类的较理想的特征，从而最终提升分类和预测的准确性。

图像技术与深度学习结合后焕发了新的生命。2012年，深度学习在图像识别领域取得惊人的效果，在ImageNet评测上将错误率从26％一举降低到15％，自此图像技术迸发了巨大的能量。深度学习对视觉技术重要性的一个佐证，就是脑神经系统的确具有丰富的层次结构，如Hubel—Wiesel模型，由于揭示了视觉神经的机理而曾获得诺贝尔医学与生理学奖。

2012年6月，《纽约时报》披露了Google Brain项目，这个项目是由现百度研究院院长、著名的斯坦福大学机器学习教授Andrew Ng和大规模计算专家Jeff Dean共同主导，用16000个CPU Core的并行计算平台训练深层神经网络模型，可以教会计算机自主识别出“猫”。百度是国内图像视觉技术积累最为深厚的企业机构，其图像技术成果和应用也得到业界的广泛认可。目前百度拥有世界上规模最大的人工神经网络，并在图像识别、人脸和文字识别、图像搜索等领域都有一流的产品应用。

随着大数据时代的来临，图像和视频数据呈爆发性增长，若同时处理亿级别、几十亿级别的图像视频数据是一个巨大的难题，因此深度学习技术一直面临着性能的挑战。另一方面，图像识别技术尤其是不限定类别的通用图像识别，仍然是一个离实用和人类期待有差距的技术，但这个技术极为重要，它是计算机认识和理解世界的最重要窗口，因此必须持之以恒地加大投入、攻克技术难题。

三、深度学习技术在图像中的应用

相似图片搜索系统：可以实现图像的识别并从图片库检索到相同和相似图片。

拍照搜索：该技术多用于商业营销，如百度识图对于无法精确描述的服装、箱包，与运营平台合作可以实现拍照搜索和购买，有巨大的商业潜力。

人脸识别：FaceBook利用该功能加强客户粘性。用户可以利用人脸识别功能，帮助他们方便地在一张照片中识别一位朋友并分享内容。当用户上传新照片后，可使用一种与很多图片编辑工具相似的软件，将新照片与用户已经加了标签的照片进行匹配，把相似的照片归为一组，然后尽可能地向用户推荐照片中朋友的名字。这项功能提高了用户给照片加标签的效率，特别是用户一次上传很多张相同的朋友的照片的时候。

深度学习受到了从学术界到工业界广泛的重视，并在图像分类、识别等方面取得了惊人的进展，从而推动了人工智能的大踏步前进。金融行业可以将图像发掘技术应用于识别方面，如签名、账单OCR电子化识别、视频影像中的人像识别等。同时，作为一项图像发掘的基础技术，深度学习还能在其他领域发挥重要的作用。金融行业可以利用人工智能技术从数据中挖掘价值，做出准确的推理和预测，实现精准营销和个性化服务，驱动金融产品创新。

（文章来源：《金融电子化》杂志）

扫码即可手机
阅读转发此文

本文评论

频道最近更新

通往互联网金融的IT选择

商业银行发展互联网金融，其实对既有的技术体系规划和设计提出了新的要求。

频道热门文章

通往互联网金融的IT选择

商业银行发展互联网金融，其实对既有的技术体系规划和设计提出了新的要求。

图像挖掘焕发商业新生命

本文评论

相关文章

频道最近更新

频道热门文章